GPT系列模型的工作原理
GPT(Generative Pre-trained Transformer)系列模型是基于Transformer 架构的生成式大语言模型,核心逻辑可拆解为 “预训练 - 微调” 两大阶段,通过 “理解语境 - 预测下一个词” 的方式实现自然语言生成,以下从技
模型 gpt transformer 向量 token 2025-09-30 15:21 1
GPT(Generative Pre-trained Transformer)系列模型是基于Transformer 架构的生成式大语言模型,核心逻辑可拆解为 “预训练 - 微调” 两大阶段,通过 “理解语境 - 预测下一个词” 的方式实现自然语言生成,以下从技
模型 gpt transformer 向量 token 2025-09-30 15:21 1
据Gartner等权威机构报告显示,近年来全球因数字身份泄露引发的安全事件增长率持续攀升,超过70%的网络攻击事件根源可追溯至数字身份防护的薄弱环节。数字身份作为攻击向量正呈现出攻击手段愈发复杂、攻击目标范围扩大等特点,给企业和个人带来了更大的安全风险。
用 Milvus 做向量搜索时,你是不是也遇到过这样的麻烦:数据放进 Milvus 之前,得先自己做一堆预处理,用各种模型把文字、图片、音频转成向量(也就是 “向量化”),还得提取特征、调整格式……
LLM生态正以前所未有的速度改变着各行各业的发展格局。从金融服务到医疗健康,从制造业到教育培训,从零售电商到法律服务,AI技术正在深度模拟传统业务流程,带来颠覆性的变革。
9月25日,“为AI而生”的向量数据库VexDB正式发布!清华大学计算机科学与技术系教授、数智引航技术顾问李国良、数智引航首席专家孙佶,行业学会领导、重点行业用户以及科技企业代表应邀出席,与线上观众共同见证了向量数据库VexDB的重磅发布。
无论是搜推召回、大模型增强生成(RAG)、还是视频图像检索,向量检索都是核心基础。但多数现有向量检索算法如HNSW、NSG、IVFPQ等未针对鲲鹏架构深度优化,难以充分发挥鲲鹏算力性能优势。
向量 鲲鹏 kbest 鲲鹏boostkit boostki 2025-09-25 19:45 4
RAG(检索增强生成)本质上就是给AI模型外挂一个知识库。平常用ChatGPT只能基于训练数据回答问题,但RAG可以让它查阅你的专有文档——不管是内部报告、技术文档还是业务资料,都能成为AI的参考资源。
人工智能正在重塑数据库的设计理念。传统数据库(包括关系型与NoSQL)专为结构化数据和分析查询设计——它们依赖整齐的表格、固定结构和明确定义的字段。查询必须完全匹配关键词和筛选条件,否则将一无所获。
向量数据库就是存储一些浮点数组的数据库,简单理解为能保存数据和根据一个相似数据进行查询即可,传统数据库开发者可以轻松上手,sql数据库和文档数据库用户都可以无缝衔接。比如MySQL 9支持了vector字段类型,postgresql通过pgvector插件实现
检索增强生成(RAG)已成为构建生成式 AI 应用的主流架构,企业选择它主要原本是可以用自有数据约束模型输出,使答案更准确、可更新且更贴合业务场景。RAG 的效果在很大程度上取决于检索到的上下文质量——提升效果的常用手段包括合理切分文本块(chunking)、
近日,国际权威多步推理数据分析基准DABStep最新榜单揭晓:基于VexDB的数据智能体以绝对优势加冕桂冠,成为首个在该测试中登顶的国产向量数据库。
别让“上云”变“上坟”——当数据合规警报拉响,越来越多企业把AI搬回自家机房。这篇入门手册带你零门槛搭一套私有化AI:从GPU选型、容器编排,到模型蒸馏、权限网关,每一步都给出开源脚本与踩坑清单。读完你就能在防火墙内跑通第一个大模型,让“算力自由”与“数据安全
近日,国际权威多步推理数据分析基准DABStep最新榜单揭晓:基于数智引航 VexDB的数据智能体以绝对优势登顶,成为首个在该测试中夺冠的国产向量数据库。
为什么要做向量搜索?当前智能时代的搜索需求已发生变化,传统搜索多基于词汇匹配,比如搜索某个词,若该词不存在则无法得到结果。但向量搜索能突破这一限制,例如“我爱你”和“我喜欢你”语义相近,通过向量搜索可相互匹配;即便是多语言场景,如“I like you”和“I
搜索 rag 向量 elasticsearch rag应用 2025-09-16 07:00 5
这种写法是 “局部操作(梯度)显式求和 + 整体操作(点积)隐含求和” 的习惯表达,本质上两项都涉及对向量场所有分量的求和。
import numpy as np# 构造词表vocab = ['apple', 'banana', 'cat', 'dog', 'elephant']# “cat”是词表第2号(索引从0计数)cat_index = vocab.index('cat') #
这就像你对暗恋对象说:"我喜欢听你说话",结果对方回答:"哦,我也喜欢听歌"。两个人说的都是中文,却完全不在一个频道上。
Semantic Kernel 提供了向量存储(Vector Store)抽象层中的向量搜索功能,支持多种选项如过滤、分页等。本文将详细介绍其用法。
搜索 向量 kernel semantickernel 连接 2025-09-08 08:40 5
在上几篇文章中,我们探讨了Semantic Kernel的规划器如何自动化多步任务,让AI像传统工作流一样高效运行。作为一个专注.NET开发的博主,我发现Memory机制是让系统真正“聪明”的基础。它不是简单的缓存,而是能让AI记住上下文、检索知识,就像传统数
向量 kernel semantickernel 向量存储 2025-09-07 09:40 4
在跨语言沟通场景中,大语言模型(LLM)凭借对多语言语义的深度理解,已成为机器翻译的核心技术方案。其实现翻译的过程,既依托预训练积累的多语言知识,也需通过任务优化适配不同语言对,整体可拆解为三大关键环节。